16个推荐系统开放公共数据集整理分享 |
您所在的位置:网站首页 › kaggle 推荐 › 16个推荐系统开放公共数据集整理分享 |
(本文由深度学习与NLP编译) 本文主要整理了一些与推荐系统相关的高质量的数据集。整理自Stack Overflow、一些文章、推荐站点和学术实验。其中,大多数数据集都是免费、开放的,但有些不是,需要获得许可或引用作者的工作才能使用。此外,其中也包含一些预处理数据,可用于学术实验。链接和数据集描述。
Book · 1. Book Crossing BookCrossing(BX)数据集由Cai-Nicolas花了的4周(2004年8月/ 9月)从Book-Crossing社区中爬取得到的。 · 下载链接:http://www2.informatik.uni-freiburg.de/~cziegler/BX/
电子商务 · 2. Amazon 该数据集包括自1996年5月至2014年7月,来自亚马逊上的1.428亿产品的评论和metadata。 · 下载链接:http://jmcauley.ucsd.edu/data/amazon/
· 3. Retailrocket推荐系统数据集 该数据集由三个文件组成:一个行为数据集(events.csv),一个属性数据集(item_properties.сsv)和一个类目树数据集(category_tree.сsv)。该数据来自现实世界的电子商务网站。 · 下载链接:https://www.kaggle.com/retailrocket/ecommerce-dataset
音乐 · 4. Amazon Music 该数字音乐数据集包含来自亚马逊的评论和元数据 · 下载链接:http://jmcauley.ucsd.edu/data/amazon/
· 5. Yahoo Music 该数据集是一个快照,收集了音乐社区对各种音乐艺术家的偏好。 · 下载链接:https://webscope.sandbox.yahoo.com/catalog.php?datatype=r
· 6. LastFM(Implicit) 该数据集收集了Last.fm网站上2千名用户的社交网络、tagging和music artist listening信息。 · 下载链接:https://grouplens.org/datasets/hetrec-2011/
· 7. Milion Song Dataset Million Song数据集是一个免费的数据集,提供了一百万条当代流行音乐曲目相关的的audio features和metadata。 · 下载链接:https://labrosa.ee.columbia.edu/millionsong/
电影 · 8. MovieLens GroupLens Research已经从他们的电影网站收集整理的rating数据集。 · 下载链接:https://grouplens.org/datasets/movielens/
· 9. Yahoo Movies 该数据集包含从两个不同来源收集的歌曲的rating数据集。第一个来源是用户在与Yahoo上使用音乐服务是产生的rating数据。 · 下载链接:https://webscope.sandbox.yahoo.com/catalog.php?datatype=r
· 10. CiaoDVD CiaoDVD是2013年12月从http://dvd.ciao.co.uk网站上抓取的DVD类别数据集。 · 下载链接:https://webscope.sandbox.yahoo.com/catalog.php?datatype=r
·11. FilmTrust FilmTrust是2011年6月从整个FilmTrust网站上抓取的一个小型数据集。 · 下载链接:https://www.librec.net/datasets.html
· 12. Netflix 这是Netflix奖竞赛中使用的官方数据集。 · 下载链接:http://academictorrents.com/details/9b13183dc4d60676b773c9e2cd6de5e5542cee9a
游戏 · 13. Steam Video Games 这是一个用户行数据集,包含:user-id,game-title,behavior-name,value。包括“purchase”和“play”数据集。购买了,puchase的值为1,而“play”的值表示用户播放音乐的时长。 · 下载链接:https://www.kaggle.com/tamber/steam-video-games/data
Jokes · 14. Jester 该笑话数据集包含来自73,496个用户,关于100个笑话的410万连续rating数据(-10.00到+10.00) · 下载链接:http://www.ieor.berkeley.edu/~goldberg/jester-data/
餐饮 ·15. Chicago Entree 该数据集包含用户与Entree Chicago餐厅推荐系统交互的记录数据。 · 下载链接:http://archive.ics.uci.edu/ml/datasets/Entree+Chicago+Recommendation+Data
动漫 ·16. 动漫推荐数据库 该数据集包含来自12,294个动漫的73,516个用户的用户偏好数据。每个用户都可以将动画添加到已完成的列表中并为其评分,该数据集把这些评级整理起来。 · 下载链接:https://www.kaggle.com/CooperUnion/anime-recommendations-database
其他数据集 · GroupLens数据集 · 下载链接:https://grouplens.org/datasets/
· LibRec数据集 · 下载链接:https://www.librec.net/datasets.html
· Yahoo Research数据集 · 下载链接:https://webscope.sandbox.yahoo.com/catalog.php?datatype=r
· 斯坦福大型网络数据集汇编 · 下载链接:https://snap.stanford.edu/data/ |
今日新闻 |
推荐新闻 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |